UCV-Escuela Economía- Estadística 1

Ejercicio Práctico

Estadística Descriptiva

# cargar librerías a trabajar
library(ggplot2)
library(dplyr)

Leer los datos

Desde el repositorio del curso ubicado en repositorio datos

# gapminder 2007
gap_2007 <- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1-2-2025/refs/heads/main/data/gap_2007.csv')
# notas quiz1
quiz1<- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1-2-2025/refs/heads/main/data/quiz1.csv')
# encuesta Estadística 1-2025 UCV
df_encuesta <- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1-2-2025/refs/heads/main/data/df_curso.csv')

Inspeccionar conjunto de datos

  • Media
  • Mediana
  • Histograma
  • Gráfico de caja boxplot(boxplot)
  • Medidas de dispersión
  • Rango
  • Cuartiles
# revisar conjunto de datos
gap_2007
# cantidad observaciones
nrow(gap_2007)
gap_2007$lifeExp
# ordenar valores ascendentemente
sort(gap_2007$lifeExp)
# asignar a una variables
expect_vida <- sort(gap_2007$lifeExp)
# revisar valores
expect_vida
# media o promedio
mean(expect_vida)
# mediana
median(expect_vida)
# mitad de los datos en el valor
nrow(gap_2007)/2
# valores en la mitad
expect_vida[71]
expect_vida[72]
# calcular la mediana para cantidades pares en el número de observaciones
(expect_vida[71]  + expect_vida[72] )/2
# tabla resumen de una columna
summary(gap_2007$lifeExp)
# tabla resumen de los valores expect_vida
summary(expect_vida)
# tabla resumen de pib per cápita
summary(gap_2007$gdpPercap)
# histograma con RBase para la PIB per cápita
hist(gap_2007$gdpPercap)
# histograma para expectativa de vida
hist(expect_vida, col='orange')
# en otro color
hist(expect_vida, col ='blue')
# añadir línea media
hist(expect_vida, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 2, lty = 2)
# añadir línea mediana
hist(expect_vida, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 2, lty = 2)
abline(v = median(expect_vida), col = "green", lwd = 2, lty = 2)
# obtener desviación típica
desviacion_tipica <- sd(expect_vida)
# llamar (ver el valor asignado a la variable)
desviacion_tipica
# calcular 1 desviación de la media por encima
desviacion_1pos <- mean(expect_vida)+ 1*desviacion_tipica
desviacion_1pos
# calcular 1 desviación de la media por debajo
desviacion_1neg <- mean(expect_vida)- 1*desviacion_tipica
desviacion_1neg
# calcular dos desviaciones
desviacion_2pos <- mean(expect_vida)+ 2*desviacion_tipica
desviacion_2neg <- mean(expect_vida)- 2*desviacion_tipica
desviacion_2pos
desviacion_2neg
# graficar una desviación de la media
hist(gap_2007$lifeExp, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 4, lty = 2)
abline(v = desviacion_1pos, col = "orange", lwd = 3, lty = 2)
abline(v = desviacion_1neg, col = "orange", lwd = 3, lty = 2)

#abline(v = -sd(gap_2007$lifeExp), col = "orange", lwd = 2, lty = 2)
# graficar dos desviaciones de la media
hist(gap_2007$lifeExp, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 4, lty = 2)
abline(v = desviacion_1pos, col = "orange", lwd = 3, lty = 2)
abline(v = desviacion_1neg, col = "orange", lwd = 3, lty = 2)
abline(v = desviacion_2pos, col = "purple", lwd = 3, lty = 2)
abline(v = desviacion_2neg, col = "purple", lwd = 3, lty = 2)

Gráficos con sistema ggplot para ir del gráfico de puntos al gráfico de caja pasando por el histograma

# variable en estudio: notas del quiz1
variable_estudio <- quiz1
nombre_variable <- 'Notas Quiz1'
variable_estudio
nombre_variable
ggplot(data=variable_estudio,
       aes(x=quiz1,y=0)) +
  geom_point()
ggplot(data=variable_estudio,
       aes(x=quiz1)) +
  geom_dotplot()
# cambio en el ancho del punto
ggplot(data= variable_estudio,
       aes(x=quiz1)) +
  geom_dotplot(binwidth=2,
               fill="blue") +
  xlab(nombre_variable) +
  ylab("Frecuencia")
# pasar al histograma
ggplot(data=variable_estudio,
       aes(x=quiz1)) +
  geom_histogram(binwidth=1,
               fill="blue") +
  xlab(nombre_variable)
# asignar colores por una variable categórica
ggplot(data=gap_2007,
       aes(x=lifeExp,
           fill=continent)) +
  geom_dotplot(binwidth=1) +
  xlab('Expectativa de Vida') +
  ylab("Frecuencia") +
  ggtitle("Dotplot de la Expectativa de Vida por Continente ")
ggplot(data=gap_2007,
       aes(x=lifeExp,
           fill=continent)) +
  geom_histogram() +
  xlab('Expectativa de Vida') +
  ylab("Frecuencia") +
  ggtitle("Dotplot de la Expectativa de Vida por Continente ")

ggplot(data=gap_2007,
       aes(x=lifeExp,
           fill=continent)) +
  geom_histogram(bins=6) +
  xlab('Expectativa de Vida') +
  ylab("Frecuencia") +
  ggtitle("Dotplot de la Expectativa de Vida por Continente ")
# cambio en el ancho del punto
nota_mediana <- median(variable_estudio$quiz1, na.rm = TRUE)
nota_mediana
ggplot(data=variable_estudio,
       aes(x=quiz1,y=0)) +
  geom_point() +
  geom_vline(xintercept =nota_mediana,
           color = "red",
             linetype = "dashed",   # Tipo de línea (e.g., "solid", "dotted")
             linewidth = 1)
boxplot(variable_estudio$quiz1, horizontal = TRUE)
boxplot(variable_estudio$quiz1)
ggplot(data=gap_2007,
       aes(x=lifeExp,y=0)) +
  geom_point() +
  geom_vline(xintercept =median(gap_2007$lifeExp),
           color = "red",
             linetype = "dashed",   # Tipo de línea (e.g., "solid", "dotted")
             linewidth = 1)+
  geom_vline(xintercept =mean(gap_2007$lifeExp),
           color = "blue",
             linetype = "dashed",   # Tipo de línea (e.g., "solid", "dotted")
             linewidth = 1)
boxplot(gap_2007$lifeExp, horizontal = TRUE)
boxplot(gap_2007$lifeExp)
hist(expect_vida)
abline(v = mean(expect_vida), col = "blue", lwd = 2, lty = 2)
abline(v = median(expect_vida), col = "red", lwd = 2, lty = 2)

Trabajar con nuestros Datos

df_encuesta
A data.frame: 0 × 17
peso altura Edad hermanos cod.postal sexo dia.nacionmiento hijos distancia tranporte trabaja materias.cursadas horas.estudio promedio.acad red.social consumo.drogas hora.registro
<lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl>